আমরা আগেই বলেছি কম্পিউটারের ভেতর ডিজিটাল প্রক্রিয়া চালানোর জন্য দুইটি ভিন্ন ভিন্ন ভোল্টেজ দিয়ে যাবতীয় ইলেকট্রনিক্স কাজকর্ম করা হয়। এই দুইটি ভোল্টেজের একটিকে 0 অন্যটিকে 1 হিসেবে বিবেচনা করে বাইনারি সংখ্যা হিসেবে যে কোনো সংখ্যাকে প্রক্রিয়া করা সম্ভব হয়। কিন্তু আমরা সবাই জানি কম্পিউটারে শুধু সংখ্যা প্রবেশ করিয়ে সেগুলোকে নানা ধরনের প্রক্রিয়া করলেই হয় না সেখানে নানা ধরনের বর্ণ, শব্দ, চিহ্ন এগুলোকে প্রক্রিয়া করতে হয়। কম্পিউটার যেহেতু অভ্যন্তরীণ ইলেকট্রনিক সার্কিটে 0 এবং 1 ছাড়া অন্য অভ্যন্তরীণ ইলেকট্রনিক সার্কিটে কোনো কিছু প্রক্রিয়া করতে পারে না, তাই শব্দ চিহ্ন বর্ণ তাদের সবকিছুকেই প্রথমে এই 0 এবং 1 এ রূপান্তরিত করে নিতে হয়। বর্ণ, অক্ষর, শব্দ বা চিহ্নকে এভাবে বাইনারিতে রূপান্তর করার প্রক্রিয়াকে কোডিং করা বলা হয়ে থাকে। নিচে এই ধরনের প্রচলিত কয়েকটি কোডের উদাহরণ দেওয়া হলো।
বিসিডি (BCD)
আমরা আমাদের দৈনন্দিন হিসাব নিকাশ সবসময়ই দশমিক সংখ্যা দিয়ে করে থাকি। এই সংখ্যাকে কম্পিউটারে কিংবা ইলেকট্রনিক সার্কিট দিয়ে ডিজিটাল প্রক্রিয়া করার জন্য সেগুলোকে বাইনারিতে রূপান্তর করে নিতে হয়। কিন্তু দশমিক সংখ্যার বহুল ব্যবহারের জন্য এর দশমিক রূপটি যতটুকু সম্ভব অক্ষুণ্ণ রেখে বাইনারি সংখ্যায় রূপান্তর করার জন্য বিসিডি (BCD: Binary Coded Decimal) কোডিং পদ্ধতি গ্রহণ করা হয়েছে।
এই পদ্ধতিতে একটি দশমিক সংখ্যার প্রত্যেকটি অঙ্ককে আলাদাভাবে চারটি বাইনারি বিট দিয়ে প্রকাশ করা হয়। যদিও চার বিটে 0 থেকে 15 এই 16টি সংখ্যা প্রকাশ করা সম্ভব, কিন্তু BCD কোডে 10 থেকে 15 পর্যন্ত এই বাড়তি ছয়টি সংখ্যা কখনোই ব্যবহার করা হয় না। দশমিক 10কে বাইনারিতে 1010 হিসেবে চার বিটে লেখা যায় কিন্তু বিসিডিতে 0001 0000 এই আট বিটের প্রয়োজন। নিচে BCD কোডের একটি উদাহরণ দেওয়া হলো :
উদাহরণ : 100100100110 বিসিডি কোডে লেখা একটি দশমিক সংখ্যা, সংখ্যাটি কত? উত্তর : 100100100110 বিটগুলোকে চারটি করে বিটে ভাগ করে প্রতি চার বিটের জন্য নির্ধারিত দশমিক অঙ্কটি বসাতে হবে।
আলফানিউমেরিক কোড (Alphanumeric Code)
কম্পিউটারে সংখ্যার সাথে সাথে নানা বর্ণ, যতিচিহ্ন, গাণিতিক চিহ্ন ইত্যাদি ব্যবহার করতে হয়। যে কোডিংয়ে সংখ্যার সাথে সাথে অক্ষর, যতিচিহ্ন, গাণিতিক চিহ্ন ইত্যাদি ব্যবহার করা যায় সেগুলোতে আলফা নিউমেরিক কোড ব্যবহার করা হয়। নিচে কয়েকটি আলফা নিউমেরিক কোডের উদাহরণ দেওয়া হলো।
ই বি সি ডি আই সি ( EBCDIC)
EBCDIC (Extended Binary Coded Decimal Interchange Code) একটি আর্ট বিটের কোডিং। যেহেতু এটি আট বিটের কোড, কাজেই এখানে সব মিলিয়ে 256টি ভিন্ন ভিন্ন চিহ্ন প্রকাশ করা সম্ভব। আই বি এম নামের একটি কম্পিউটার কোম্পানি তাদের কম্পিউটারে সংখ্যার সাথে সাথে অক্ষর যতিচিহ্ন ইত্যাদি ব্যবহার করার জন্য BCD -এর সঙ্গে মিল রেখে এই কোডটি তৈরি করেছিল। 1963 এবং 1964 সালে কম্পিউটারে ইনপুট দেওয়ার পদ্ধতিটি ছিল- অনেক প্রাচীন কাগজের কার্ডে গর্ত করে ইনপুট দিতে হতো। কাজেই EBCDIC তৈরি করার সময় কাগজে গর্ত করার বিষয়টিও বিবেচনা করা হয়েছিল। সেই সময়ের কম্পিউটারে ইনপুট দেওয়ার জটিলতা এখন আর নেই, কাজেই EBCDIC কোডটিরও কোনো গুরুত্ব নেই।
অ্যাসকি (ASCII)
ASCII হচ্ছে American Standard Code for Information Interchange কথাটির সংক্ষিপ্ত রূপ। এটি সাত বিটের একটি আলফানিউমেরিক কোড। এটি প্রাথমিকভাবে টেলিপ্রিন্টারে ব্যবহার করার জন্য তৈরি করা হয়েছিল এবং পরবর্তীকালে কম্পিউটারে এটি সমন্বয় করা হয়। সাত বিটের কোড হওয়ার কারণে এখানে সব মিলিয়ে 128টি চিহ্ন প্রকাশ করা যায়। এর প্রথম 32টি কোড যান্ত্রিক নিয়ন্ত্রণের জন্য ব্যবহার করা হয়, বাকি 96টি কোড ছোট হাতের, বড় হাতের ইংরেজি অক্ষর, সংখ্যা, যতিচিহ্ন, গাণিতিক চিহ্ন ইত্যাদির জন্য ব্যবহার করা হয়। টেবিলে অ্যাসকি কোডটি দেখানো হলো। ইদানীং 16, 32 কিংবা 64 বিট কম্পিউটারের প্রচলনের জন্য সাত বিটের ASCII- তে সীমাবদ্ধ থাকার প্রয়োজন নেই বলে অষ্টম বিট যুক্ত করে Extended ASCII- তে আরো 128টি চিহ্ন নানাভাবে ব্যবহার হলেও প্রকৃত ASCII বলতে এখনো মূল 128টি চিহ্নকেই বোঝানো হয়। টেবিলে অ্যাসকি কোডের প্রথম 32টি যান্ত্রিক নিয়ন্ত্রণের কোড (0-31) ছাড়া পরবর্তী 96টি (32-127) প্রতীক দেখানো হয়েছে।
ইউনিকোড (Unicode)
ইউনিকোড হলো প্রাচীন মিশরীয় হায়ারোগ্লিফিক্স ভাষা থেকে শুরু করে বর্তমান সময়ের অক্ষর, বর্ণ, চিহ্ন, ইমোজি ইত্যাদির এনকোডিং পদ্ধতি। বর্তমানে পূর্বের এনকোডিং পদ্ধতি যেমন ASCII ও EBCDIC-কেও ইউনিকোডের আওতায় আনা হয়েছে। তথা পৃথিবীর প্রায় সব ভাষার লেখালেখির মাধ্যমগুলোকে ইউনিকোড পদ্ধতিতে সমন্বিত করা হয়েছে। ইউনিকোড ৩. UTF-32: এটি 32 বিটের (longs) একক। এখানে একটি অক্ষরকে নির্ধারিত 4 বাইটের মধ্যে উপস্থাপন করা হয়। এখানে দক্ষতার সাথে অক্ষরকে ব্যবহার করা হয়।
উল্লেখ থাকে যে, UTF-8 এবং UTF-16 হচ্ছে সবচেয়ে প্রচলিত পদ্ধতি। এর মাঝে ওয়েবসাইটে ব্যবহার করার জন্য UTF-8 অলিখিত স্ট্যান্ডার্ড হয়ে দাঁড়িয়েছে। কারণ এ ক্ষেত্রে প্রতিটি বর্ণের জন্য 4 বাইট স্থান সংরক্ষণ করা থাকলেও ব্যবহারের ক্ষেত্রে UTF-8 শুধুমাত্র যতগুলো বিট প্রয়োজন হয় ততটুকু ব্যবহার করে থাকে।